
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。
谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。
GPT-5要来了,来势汹汹!泄露的基准测试+Minecraft实测,直接让全网惊掉下巴:代号Zenith的GPT-5-pro在游戏中如行云流水,被称为「魔法级AI」。更有爆料称它将于7月31日发布,吊打Grok 4 Heavy!OpenAI这是又要掀桌了?
时间线里,一个少女的身影不断出现。很多人晒出自己和她的对话视频,有的在闲聊,有的要她唱歌跳舞,还有人激动地说:「升到三级以后,她开始撩我了。」
今天凌晨,马斯克突然通知大家:快来更新 Grok APP,出新功能了。新推出的功能名为「智能伴侣」,基于前几天刚推出的 Grok 4 大模型,可以和人们实现自然的交互。大家一看这个效果,讨论的热度比前几天新模型发布还大。
什么样的 AI,才配被称为「地球上最聪明」?Grok 4 的答案或许是,在敏感问题上,先查查老板说了什么。
Grok 4 发出之后,风评非常两级。有人大喷特喷,觉得它又贵又不好用。有的则啧啧称神,断言「AGI 已经实现啦」。
今天是 xAI 的大日子,伊隆・马斯克早早就宣布了会在今天发布 Grok 4 大模型,AI 社区的眼球也已经向其聚拢,就等着看他的直播(等了挺久)。当然,考虑到 Grok 这些天的「失控」表现,自然也有不少人是在等着看笑话。
Grok 4一夜爆火硅谷,幕后团队功不可没。今天,一张内部作战图在全网疯转,华人学者占比高达80%。清华、上交、浙大等校友云集,还有一位95后联创。
斯克憋了快半年,终于把 Grok 4 端上了台面。这一次,他的口气依旧不小。早在发布会前就放出狠话,声称 Grok 4 要「重写人类知识库」。等到了发布会上,马斯克再次强调 Grok 4 是目前世界上最聪明的 AI。
刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称,Grok 4 在 HLE(Humanities Last Exam,人类最后考试)上的标准得分是 35%,使用推理技术后提高到 45%;在 GPQA 上的得分是 87-88%;而Grok 4 Code 在 SWE Bench 上的得分则达到 72-75%。